Selección en cascada de tokens para la aceleración de la atención del Transformer Aceleración de la atención en Transformers mediante selección en cascada: técnica eficiente que reduce costos computacionales sin sacrificar precisión. 2026-05-06 · 3 min